課程資訊
課程名稱
資料探勘
Data Mining 
開課學期
103-2 
授課對象
工學院  醫學工程學研究所  
授課教師
蔣以仁 
課號
Biomed7083 
課程識別碼
548EM1240 
班次
 
學分
全/半年
半年 
必/選修
選修 
上課時間
星期三2,3,4(9:10~12:10) 
上課地點
 
備註
本課程以英語授課。教室:基醫507。
總人數上限:20人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1032Biomed7083_ 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

資料探勘 

課程目標
1. 資料發掘的技術介紹與類型─主要使學者了解何謂知識發掘,知識發掘的成因及演進,及各種熟知的技術,如下列:
(1) 決策樹(Decision Trees):於成本效益分析之應用;
(2) 類神經網路(Artificial Neural Networks):於疾病預測之應用;
(3) 貝氏網路(Bayesian Networks):於臨床特徵施行病學臨床試驗之應用;
(4) 模糊邏輯(Fuzzy Logic)與括約集合(Rough Sets):於疾病分類之應用等技術;另就技術與應用領域而言,探討知識發掘技術之類型。
2. 知識發掘與資料分析之異同─說明解說統計方法與知識發掘方法相似與相異之處,並以實例探討效果及限制。
3. 醫療資料倉儲的建立─探討如何進行知識發掘的第一步,即整理並歸納資料,以建立完整醫療資料倉儲的方法。
4. 分類技術(Classifications & Clustering)、時序連續因子分析(Time-Series & Temporal Analysis)、交互重要性分析(Association & Dependence)、及重要因子研判(Feature Selection & Factor Analysis) 等知識發掘技術在醫療資訊上中作重要研判的應用之探討,探究如何應用知識發掘進行疾病診斷與治療的研判。
5. 持續改善:因應每屆修課學生背景不同而調整授課內容、難易度與課程進度。 
課程要求
無 
預期每週課後學習時數
 
Office Hours
 
指定閱讀
待補 
參考書目
資料探勘相關文獻 
評量方式
(僅供參考)
   
課程進度
週次
日期
單元主題
第1週
2/25  Overview 
第2週
3/04  Bias and Variances 
第3週
3/11  Sample and Clustering 
第4週
3/18  Hierarchical Clustering 
第5週
3/25  Density, Grid, and Graph Based Clustering 
第6週
4/01  Tree Classifiers 
第7週
4/08  Association Rules 
第8週
4/15  Midterm 
第9週
4/22  Artificial Neural Network 
第10週
4/29  RBF & SOM 
第11週
5/06  SVM 
第12週
5/13  Data Analysis in R 
第13週
5/20  Feature Selections 
第15週
6/03  Big Data Analysis 
第16週
6/10  Final Project Presentation 
第17週
6/17  Final Project Presentation